我們上一篇談到「資料團隊架構」時,講到近年開始往非階層式組織,去中心化的趨勢。我們稍微倒退一點,大約 2017 年 Data Infra 仍在發展中的狀態,私有雲裡容器隔離的「多租戶」還不普及,而是集中式資料平台裡的「同居人」。更早以前,大家都處於個別系統中的 Data Silo (資料孤島),跨組織共同資料規範的必要性有限。
資料來源:https://anujxagarwal.medium.com/understand-data-products-and-data-product-management-bdc207418b2f
這是DAMA International(國際資料管理協會)的定義,包括資料共享決策的規劃、監測和執行。
資料治理是規範企業內共通的資料管理方法,資料資產中最有價值的就是資料產品,凝練資料價值,承載「企業知識」與「企業經驗」,在企業內跨部門的多元應用越是廣泛,綜合效益就越高。
圖片來源:筆者自行繪製
圖片素材:
https://www.evalueserve.com/
https://scienceexchange.caltech.edu/topics/artificial-intelligence-research/artificial-intelligence-vs-machine-learning
經濟價值
管理價值
社會價值
依據 DAMA 的 DMBoK ,資料治理可劃分十大知識領域:
如果把上述知識領域,依據屬性劃分可以再組合如下:
圖片來源:炬識科技
這十大知識領域也是企業必須建立組織、流程與規範標準的資料治理分項目。
我們看過太多失敗的例子,有的因為只想導入工具(技術),有的因為一次範圍開太大,有的因為組織不當。
那麼千頭萬緒,如何展開?我們建議從資料目錄開始,是最平順的起手式。
圖片來源:炬識科技
更多內容可以造訪 DAMA 官網:https://www.dama.org/cpages/home